Objetivos

1. Caracterizar los perfiles proteicos de bacterias desarrolladas en diferentes medios de cultivo (TSA.glucosa, TSA, Agar leche y Agar suero) por la técnica de MALDI-TOF-MS.

2. Identificar señales espectrales (picos) diferenciales entre las bacterias con diferentes grados de producción de biofilm.

3. Asignar dichos picos diferenciales con proteínas descriptas en bases de datos (búsqueda bio-informática).

Protocolo experimental

Las colonias de bacterias se recolectaron con un palillo de madera estéril y se colocaron en el electrodo multi-well del equipo Microflex LT por cuatriplicado biológico y triplicado técnico. Se colocó 1 μl de Ácido fórmico (sigma) sobre las colonias y se dejó evaporar el líquido. Luego se colocó la matriz ácido alfa-ciano-4-hidroxicinámico (HCCA) y también se dejó evaporar. Una vez que la placa estuviera completamente seca se colocó en el equipo Microflex LT (software: flexControl 3.4.135.0, disparos de láser: 240, repetición de láser: 60, modo de ionización: LD+; rango: 2-20 kDa, método: MBT_FC.par). La intensidad del laser se seteo en 60% y se adquirieron los espectros en modo manual.

Análisis de datos

1) MALDI.ID

La determinación de las especies se hizo utilizando la base de datos de Biotyper versión 3.1.1 (BD, Bruker Daltonik GmbH, Bremen, Alemania). Los resultados arrojados por este software se interpretan del siguiente modo: sí el score es mayor a 2.0 el resultado es confiable a nivel de especie (Staphylococcus aureus), si el valor de score se ubica entre 1.7 - 2.0 el resultado es confiable a nivel de genero (Staphylococcus spp.) y, por último, si el valor de score es menor a 1.7 el resultado es no confiable.

La comparación estadística de frecuencias se realizó mediante la prueba Pearson’s Chi-squared con los p valores simulados por prueba de Monte Carlo. Posteriormente, se calcularon los residuos de Pearson, que miden el alejamiento de cada una de las frecuencias particulares al valor teórico de frecuencia homogénea. Las unidades de estos residuos están en desvíos estándar, con lo que residuos mayores a 2 (frecuencia diferencialmente elevada) o menores a -2 (frecuencia diferencialmente baja) representan un alejamiento de la independencia (homogeneidad de frecuencias) con un nivel de significación del 95%.

2) MALDI.R

a) Obtención de la matriz intensidades

El pre-procesamiento de los espectros se realizó mediante el software RStudio. Este esquema de trabajo finaliza con la obtención de una matriz de intensidades, en la cuál las columnas contienen los distintos picos (m/z), las filas los distintos sueros y las celdas los valores de intensidad. El algoritmo Binary Discriminant analysis (BDA) permite hacer una transformación binaria de las intensidades, se calcula el valor promedio de intensidad para cada columna (pico), luego si los valores puntuales superan ese valor medio se le asigna 1, caso contrario 0; a esta matriz se la denomina dicotomizada. Además se hizo una transformación binaria de las intensidades, si el valor de intensidad era mayor que 0 se asignó 1 y si era 0 se asignó 0.

b) Selección de picos diferenciales

Se realizó el análisis supervisado BDA. El objetivo fue buscar las señales espectrales (picos) que presentaran diferencias significativas entre los grupos.

c) Análisis no supervisados

En primera medida se seleccionó la matriz ( intensidad, dicotomizada y/o binaria) que mejor diferenciación generara mediante HeatMap. Posteriormente, se analizaron los perfiles de los espectros por medio del ensamble de los algoritmos Hierarchical k-means clustering- Principal component analysis (PCA) usando los mejores 5/10/15/20 picos que presentaron diferencias significativas por BDA.

d) Asignación bio-informática

Se utilizo las base de datos:Uniprot

Biofilm y marcadores bioquímicos

Niveles de producción de biofilm vs halo caseína


  • La distribución de los valores de los halos de caseina es significativamente diferencial entre los grupos de cepas caracterizadas según su nivel de producción de biofilm. Los mayores halos son producidos por bacterias categorizadas como formadoras fuertes de biofilm.

Niveles de producción de biofilm vs STX


  • La distribución de los valores STX es diferencialmente significativa entre los grupos de cepas caracterizadas según su nivel de producción de biofilm. En este caso, la relación no es lineal con respecto a la intensidad de la producción de biofilm, es decir, las formadoras fuertes no son las que mayores valores de STX presentan.

Niveles de producción de biofilm vs PIA


  • La distribución de los valores PIA es constantes entre los grupos de cepas caracterizadas según su nivel de producción de biofilm.

Niveles de producción de biofilm vs Prot.K


  • La distribución de los valores de Prot.K es significativamente diferencial entre los grupos de cepas caracterizadas según su nivel de producción de biofilm. Los mayores niveles de Prot.K son producidos por bacterias categorizadas como formadoras fuertes de biofilm.

Niveles de producción de biofilm vs DNasa


  • La distribución de los valores de DNasa es significativamente diferencial entre los grupos de cepas caracterizadas según su nivel de producción de biofilm. Los mayores niveles de DNasa son producidos por bacterias categorizadas como formadoras fuertes de biofilm.

Niveles de producción de biofilm vs Medio de cultivo


  • En el medio con suero se observó una frecuencia diferencialmente elevada de valores de biofilm NF y DBF. Los medios TSB y TSB.g presentaron las frecuencias de niveles de biofilm NF más bajas. En resumen, el biofilm parece formarse en los medios TSA y TSA.g y el medio con suero parece disminuir los niveles de producción de biofilm.

  • Las variables medios y niveles de formación de biofilm resultaron dependientes (X-squared = 71.314, df = NA, p-value = 0.0004998). Esto significa que el resultado del nivel de la formación del biofilm depende del medio en el que se crezcan las cepas.

Producción biofilm y marcadores organolépticos

Niveles de producción de biofilm vs color cepa

TSA


  • Las variables color en TSA y niveles de formación de biofilm resultaron independientes (X-squared = 6.379, df = NA, p-value = 0.09095).

  • Las cepas con niveles de biofilm FFB presentaron frecuencias elevedas de color amarillo. Los niveles MFB de color blanco.

TSA.glc


  • Las variables color en TSAglc y niveles de formación de biofilm resultaron independientes (X-squared = 7.8635, df = NA, p-value = 0.05747).

  • Las cepas con niveles de biofilm FFB presentaron frecuencias elevedas de color amarillo. Los niveles MFB de color blanco.

TSA 24 hs


  • Las variables color en TSA 24 hs y niveles de formación de biofilm resultaron independientes (X-squared = 10.495, df = NA, p-value = 0.1014).

  • Las cepas con niveles de biofilm FFB se presentaron diferencialmente asociadas con colores amarillos. Los niveles MFB con cepas color blanco.

Niveles de producción de biofilm vs color rojo congo.I

Niveles de producción de biofilm vs color rojo congo.II


  • Las cepas con niveles de biofilm FFB presentaron frecuencias elevadas pero no significativas con colonias negras rugosas.

  • Las variables color rojo congo y niveles de formación de biofilm resultaron independientes (X-squared = 6.3815, df = NA, p-value = 0.4148).

Relación de colores con FFB

Relación de colores con MFB

Relación de colores con DFB

Relación de colores con NFB

Marcadores bioquímicos y organolépticos

Colores vs Prot.K

Colores vs DNasa

Colores vs Caseina

Colores vs STX..pigmento.

Colores vs PIA

MALDI_ID

Resultados identificación


  • El gráfico de barras muestra la interpretación de los scores de las determinaciones de MALDI-TOF-MS. El gráfico está dividido en 4 bloques, uno para cada medio. En el eje-x se muestran las distintas cepas y el eje-y representa el porcentaje de especies detectado para cada cepa en los distintos medios. Las distintas especies están representadas por un código de colores.

  • Puede oberservarse como la frecuencia de especies detectada en los distintos medios es diferente. Particularmente, en el medio TSA se detectaron las cepas siempre como Staphylococcus aureus, mientras que en el medio Suero de leche, se detectaron más frecuentemente como Lactobacillus.

Análisis de frecuencias


  • Las variables especies y medios resultaron dependientes (X-squared = 125.86, df = NA, p-value = 0.0004998). Esto significa que el resultado de la identificación por MALDI-TOF-MS depende del medio en el que se crezcan las cepas.

  • El gráfico muestra que las cepas crecidas en medio TSA mostraron valores de frecuencia diferencialmente elevados en su identificación como Staphylococcus aureus. Mientras que las cepas crecidas en medio suero de leche mostraron valores de frecuencia diferencialmente disminuidos en su identificación como Staphylococcus aureus.

  • Por otro lado, las cepas crecidad en medio TSA.glc mostraron valores de frecuencia diferencialmente elevados en su identificación como Staphylococcus sp.

  • Las cepas crecidad en medio suero de leche mostraron valores de frecuencia diferencialmente elevados en su identificación como mezcla de Lactobacillus sp./Staphylococcus sp., Lactobacillus sp y Lactobacillus sakei.

  • Por último, las cepas crecidad en medio de leche, mostraron la mayor frecuencia de identificaciones no confiables.

Medio TSA.glc

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 66.9% de la variación total de los datos.

  • Se puede observar la separación de la cepa RA22 del resto de las cepas. Las cepas RA18 y MB308 no se pudieron distinguir como clusters individuales.

Medio TSA

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 61.6% de la variación total de los datos.

  • Se puede observar la separación de la cepa RA22 y RF122 del resto de las cepas. Las cepas RA18 y MB308 no se pudieron distinguir como clusters individuales.

Medio Agar_leche

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 88.1% de la variación total de los datos.

  • Se puede observar la separación de las cepas RA22, MBb30 y V329 del resto de las cepas. Las cepas MB308, MBT002, MB019, RA18, MB326 forman un cluster único.

Medio Agar_suero

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 62.2% de la variación total de los datos.

  • Se puede observar la separación en clusters individuales de todas las cepas.

MB019

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.

  • Se observa la separación en sólo 2 clusters de los 4 grupos. La cepa en TSB y TSB g son indistinguibles, así como en Ag.suero y Ag.leche.

MB308

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 90.8% de la variación total de los datos.

  • Se observa la separación en 4 clusters de los 4 grupos. La cepas son diferenciables en los cuatro medios.

MBb30

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.

  • Se observa la separación en 4 clusters de los 4 grupos. La cepas son diferenciables en los cuatro medios.

MBT002

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.

  • Se observa la separación en sólo 2 clusters de los 4 grupos. La cepa en TSB y TSB g son indistinguibles, así como en Ag.suero y Ag.leche.

RA18

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 91% de la variación total de los datos.

  • Se observa la separación en 4 clusters de los 4 grupos. La cepas son diferenciables en los cuatro medios.

RA22

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.

  • Se observa la separación en 4 clusters de los 4 grupos. La cepas son diferenciables en los cuatro medios.

RA24

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.

  • Se observa la separación en sólo 2 clusters de los 4 grupos. La cepa en TSB y TSB g son indistinguibles, así como en Ag.suero y Ag.leche.

MB326

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.

  • Se observa la separación en sólo 2 clusters de los 4 grupos. La cepa en TSB y TSB g son indistinguibles, así como en Ag.suero y Ag.leche.

V329

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.

  • Se observa la separación en 4 clusters de los 4 grupos. La cepas son diferenciables en los cuatro medios.

RF122

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada para testear la performance clasificatoria mediante la estrategia de machine learning.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 100% de la variación total de los datos.

  • Se observa la separación en 4 clusters de los 4 grupos. La cepas son diferenciables en los cuatro medios.

Meta_análisis

Biofilm en TSB.g

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 75.8% de la variación total de los datos.

Pureza de los clusters


  • Se puede observar que los clusters 1 (Cluster FFB) y 3 (Cluster DFB) presentan una homogeneidad del 100%. El cluster 2 (Cluster MFB) presenta cierto grado de heterogeneidad 15/19 casos corresponden a cepas MFB (79% de homogeneidad).

Selección de picos diferenciales


  • El gráfico muestra los 25 picos con expresión diferencial detectados por el algoritmo BDA. En este gráfico se comparan los t-scores de cada pico (m/z) entre y dentro los distintos grupos. Valores positivos y mayores a 2.5 de este score indican presencia significativa, mientras que valores negativos y menores a -2.5 indican ausencia significativa en ese grupo.

Biofilm Leche

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 94.1% de la variación total de los datos.

Pureza de los clusters


  • Se puede observar que el cluster 1 (Cluster DFB) presenta una homogeneidad del 100% pero muy pocos casos. El cluster 3 (Cluster NF) presenta una homogeneidad alta (88%) pero no total. El cluster 2 (MFB y FFB) es un cluster heterogéneo.

Selección de picos diferenciales


  • El gráfico muestra los 25 picos con expresión diferencial detectados por el algoritmo BDA. En este gráfico se comparan los t-scores de cada pico (m/z) entre y dentro los distintos grupos. Valores positivos y mayores a 2.5 de este score indican presencia significativa, mientras que valores negativos y menores a -2.5 indican ausencia significativa en ese grupo.

Perfiles

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 61.9% de la variación total de los datos.

Pureza de los clusters


  • Si bien ninguno de los clusters presenta homogeneidad, el cluster 2 está compuesto por perfiles 4_4 exclusivamente.

Selección de picos diferenciales


  • El gráfico muestra los 25 picos con expresión diferencial detectados por el algoritmo BDA. En este gráfico se comparan los t-scores de cada pico (m/z) entre y dentro los distintos grupos. Valores positivos y mayores a 2.5 de este score indican presencia significativa, mientras que valores negativos y menores a -2.5 indican ausencia significativa en ese grupo.

Sensibilidad suero

HeatMap Matriz intensidad

HeatMap Matriz binaria

HeatMap Matriz dicotomizada


  • La matriz dicotomizada es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 66% de la variación total de los datos.

Pureza de los clusters


  • El cluster 3 (R) presenta una homogeneidad del 100% y el cluster 4 (R_1S/R) presenta una homogeneidad del 94%. El cluster 1 tiene una preponderancia de cepas S y R_2S, presentando un alto grado de heterogeneidad. El cluster 2 es altamente heterogeneo.

Selección de picos diferenciales


  • El gráfico muestra los 25 picos con expresión diferencial detectados por el algoritmo BDA. En este gráfico se comparan los t-scores de cada pico (m/z) entre y dentro los distintos grupos. Valores positivos y mayores a 2.5 de este score indican presencia significativa, mientras que valores negativos y menores a -2.5 indican ausencia significativa en ese grupo.

Sensibilidad leche

HeatMap Matriz intensidad

HeatMap Matriz dicotomizada

HeatMap Matriz binaria


  • La matriz binaria es la seleccionada.

Hierarchical k-means clustering


  • Cada punto del gráfico representa el promedio de las intensidades de 3 espectros.

  • El método de partición seleccionado fue hierarchical k-means clustering, posteriormente las observaciones se representaron usando análisis de componentes principales (PCA); las dimensiones 1 y 2 explican el 38% de la variación total de los datos.

Pureza de los clusters


  • Si bien todos los clusters son heterogeneos, el cluster 4 presenta la mayor cantidad de casos R y Est.

Selección de picos diferenciales


  • El gráfico muestra los 25 picos con expresión diferencial detectados por el algoritmo BDA. En este gráfico se comparan los t-scores de cada pico (m/z) entre y dentro los distintos grupos. Valores positivos y mayores a 2.5 de este score indican presencia significativa, mientras que valores negativos y menores a -2.5 indican ausencia significativa en ese grupo.